2.3 Hente variabler inn i et datasett
Neste trinn er å fylle datasettet med ønskede variabler.
Alle underliggende variabler i microdata.no er i utgangspunktet organisert på samme måte; på hendelsesnivå:
individnummer x verdi x startdato x stoppdato
I microdata.no har en tilgang på fire typer variabler, basert på temporalitet:
-
Forløpsvariabler med sekvenser av hendelser (hver observasjon representerer en tilstandsendring, dvs. at variabelen endrer verdi, og en har variable start- og stoppdatoer)
-
Faste variabler med kun én observasjon per enhet (f.eks. kjønn, fødselsdato, fødeland)
-
Tverrsnittsvariabler målt på faste tidspunkt (variabler brukt til statistikkproduksjon, der en kun vet verdien på det aktuelle tidspunktet, startdato=stoppdato)
-
Akkumulerte variabler - hovedsaklig økonomiske opplysninger som angir årlige beløp, f.eks. årlig inntekt, formue etc.
En bygger opp datasett gjennom å benytte kommandoen import
, der en vanligvis spesifiserer en uttrekksdato/måledato (unntaket er variabler med konstante verdier som f.eks. kjønn).
I kapittel 2.3.1 vises det i detalj hvordan man bruker kommandoen import
til å importere variabler inn i et datasett med person som enhetsnivå. Kapittel 2.3.2 viser alternativ import av variabler med hendelsesnivå som enhet (personer er representert ved flere observasjoner over tid,
avhengig av antallet hendelser som har skjedd). Til dette brukes kommandoen import-event
.